Claude Opus4.6 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 Claude Opus4.6

时间 详情
2026-02-20
21:09
Claude Opus 4.6基准突破:14.5小时自主编码50%成功率—METR任务集饱和与123天能力倍增分析

据God of Prompt在X平台引用METR Evals称,Claude Opus 4.6在软件任务上的50%时间视野约为14.5小时,但METR表示其现有任务集已接近饱和,测量极其嘈杂,可能低估模型真实能力(据METR Evals)。据METR Evals,模型在真实工程任务上的能力倍增时间约为123天,这意味着从“写邮件辅助”到“接管开发流水线”的转变正快速压缩。根据God of Prompt的报道,针对Opus 4.6的提示架构与“Claude精通指南”已更新,建议团队立即升级评测基准、优化长时自主运行策略,并重新设计工作流以捕获新增性能与商业机会。